AI资讯新闻榜单内容搜索- OpenAI

GPT-5、 Opus 3.5为何迟迟不发？新猜想：已诞生，被蒸馏成小模型来卖

最近几个月，从各路媒体、AI 社区到广大网民都在关注 OpenAI 下一代大模型「GPT-5」的进展。

来自主题: AI资讯

10050 点击 2025-01-18 10:51

刚刚，阶跃星辰发布Step R-mini！推理模型从此不再文理偏科

这是阶跃星辰 Step 系列模型家族的首个推理模型。类似 OpenAI o1 的推理模型在国内终于卷起来了。

来自主题: AI资讯

7692 点击 2025-01-17 10:01

藏不住了！OpenAI的推理模型有时用中文「思考」

让我们说中文！ OpenAI o1 在推理时有个特点，就像有人考试会把关键解题步骤写在演草纸上，它会把推理时的内心 os 分点列出来。然而，最近 o1 的内心 os 是越来越不对劲了，明明是用英语提问的，但 o1 开始在演草纸上用中文「碎碎念」了。

来自主题: AI资讯

8485 点击 2025-01-16 10:17

最强代码模型刷新：Mistral新品上线即登顶，上下文窗口增至256k

“欧洲版 OpenAI” Mistral 的代码模型 CodeStral，又上新了！而且与 DeepSeek V2.5 和 Claude 3.5 平起平坐，共同位列 Copilot 竞技场第一名。

来自主题: AI资讯

9167 点击 2025-01-14 15:42

一行代码Post-Train任意长序列！360智脑开源360-LLaMA-Factory

大模型长序列的处理能力已越来越重要，像复杂长文本任务、多帧视频理解任务、以及 OpenAI 近期发布的 o1、o3 系列模型的高计算量模式，需要处理的输入 + 输出总 token 数从几万量级上升到了几百万量级。

来自主题: AI技术研报

9962 点击 2025-01-11 13:45

今年最好的AI数据报告《2024年AI应用行业年度报告》附PDF

这份《2024年AI应用行业年度报告》是由Xsignal打造的AI年终盘点大餐。全报告共78页，数据之翔实和页面之精美程度冠绝2024。添加客服微信 openai178，免费获取完整PDF。

来自主题: AI技术研报

16053 点击 2025-01-08 13:25

Just keep scaling！思维链作者Jason Wei 40分钟讲座剖析LLM扩展范式

2023 年初，Jason Wei 加入了 OpenAI，参与了 ChatGPT 的构建以及 o1 等重大项目。他的工作使思维链提示、指令微调和涌现现象等技术和概念变得广为人知。

来自主题: AI资讯

7814 点击 2025-01-04 14:32

从 Anthropic，看见 Google 曾经的样子

Anthropic 的崛起是2024年全球 AI 产业最受瞩目的现象之一，它是 OpenAI 强有力的挑战者，令很多厌倦了 OpenAI 式虚张声势和夸大其词的 AI 研究者和开发者耳目一新。

来自主题: AI资讯

6704 点击 2025-01-04 11:44

对话AI科学家刘威：“Ilya预训练终结论”对中国大模型公司影响不大

过去一段时间，“预训练终结”成为了 AI 领域最热烈的讨论之一。OpenAI的GPT系列模型此前大踏步的前进，预训练是核心推动力。而前 OpenAI 首席科学家 Ilya Sutskever、预训练和scaling law（规模定律）最忠实的倡导者，却宣称预训练要终结了、scaling law要失效。由此，引发了大量争议。

来自主题: AI资讯

10625 点击 2025-01-03 09:50

75 封内部邮件，还原最真实的 OpenAI 创业历程

我们全文翻译了这些内部交流记录，在保留语言风格、不改变原意的前提下适当编辑，并按照时间线整理，以尽可能完整呈现他们交流的情况。

来自主题: AI资讯

8692 点击 2025-01-01 12:10